Microsoft Word互操作性课程将让您获得a property called WordOpenXML
。这表示将在.docx
文件中存储(压缩)的包,可以通过Microsoft Word打开。但是,有没有办法将此Package
转换为其他格式,特别是HTML?
我在an answer中读到一个旧问题:“Word 2007有一个可用于转换为HTML的API。[...]您可以找到有关API的文档,但我记得有在API中转换为HTML函数。“我不是100%确定那个人正在谈论哪个API,但可能是System.IO.Packaging.Package
或类似的东西。我似乎无法找到任何“转换为HTML函数”;有谁知道如何将Package
格式的Word文档转换为HTML?
答案 0 :(得分:2)
有问题的API可能是文档中的Save方法;当选择HTML文件类型时,Word会将文档转换为HTML,并应用适当的样式。
鉴于docx
格式是XML,有可能进行某种类型的XSLT转换;这只是猜测,但它并不牵强,因为XSLT通常用于从XML创建HTML。
那就是说,你要找的东西可能不驻留在Package
class中,也不应该。 Package
类用于创建内容包,而不是使用该内容的转换。
但是,没有什么可以阻止你提供内容的转换;您可以获取作为Word文档基础的XML,然后应用您自己的XSLT,它将生成您想要的HTML。