如何从Word文档中提取文本?

时间:2015-03-23 12:04:43

标签: c# vb.net

我正在尝试根据坐标从Word文档中提取特定文本。我已经根据这个要求搜索了许多网站,但没有运气。如何设置Word文档文本的坐标?

2 个答案:

答案 0 :(得分:0)

this问题中的已接受答案有一个解决方案,可以在Word文档中查找某个行号的文本。

显然,你需要一些额外的代码来搜索strLine变量以寻找特定的子字符串或其他什么,但我认为我们已经完成了艰苦的工作。

答案 1 :(得分:0)

根据Word文件的格式,有两种对象模型。较旧的.doc文件使用了包含段落,表格等的文件。 .docx文件具有基于XML的结构,这是一个完全不同的模型。

如果您需要支持这两种格式,那么您的工作就已经完成了。

以下是文档的链接:

Word Object Model