我想在c#中读取docx文件。 转换为.zip时的docx文件生成我们文件的xml。 我想读那个xml文件。 我需要来自doc的所有数据,字体名称(粗体斜体设置),文件颜色。 我们怎么做到这一点?
答案 0 :(得分:4)
低级答案:DOCX文件是OPC(开放式打包约定)格式(带有清单的zip文件),可以使用System.IO.Packaging
命名空间中提供的类打开。
高级答案:DocX是一个开源框架,支持使用更高级别的构造来操作DOCX文件。
答案 1 :(得分:3)
The format of DOCX is well documented.要阅读包,您可以使用System.IO.Packaging
命名空间中的类。
答案 2 :(得分:1)
您将使用Microsoft Office 12.0对象库
答案 3 :(得分:0)
如果您能够以XML格式读取文件,那么您可以应用一些XPATH查询来获取所需的信息。