解析word文档

时间:2011-07-14 16:44:29

标签: c# sharepoint-2010

我要解析的单词文档将具有已知的格式,由单词模板定义。用户将使用单词template来创建文档。我需要使用C#从word文档中解析数据,包括下拉值。这将在SharePoint 2010服务器上完成。建议的方法是什么?我见过有人提到Open XML SDK 2.0;我应该用它吗?如果是这样,我是否需要将.docx转换为XML,然后解析它?在某些情况下,我还要写Word文档,应该怎么做?

优选地,解决方案将支持Word 2010和2007,但如果2010年的工具明显更好,我也想知道这一点。感谢。

1 个答案:

答案 0 :(得分:1)

Office Open XML的文件扩展名为.docx。 .docx文件可以描述为几个不同文件的存档。处理word文档中将存在哪些字体,样式,对象的文件。这些文件本身将被描述为XML。