用于阅读Word文档的代码

时间:2011-11-02 13:27:54

标签: c# visual-studio-2010 ms-word automation ms-office

我需要一个脚本(或其他代码,C#等),它将获取包含一组Word 2007文档中特定单词的每个段落/句子,并将它们移动到新的Word文档,记录原始文件名(源)文件是从中提取的。

3 个答案:

答案 0 :(得分:1)

如何使用文档索引器(例如dtSearch)索引文档(word,pdf等),然后使用其API进行独特的搜索。从听起来可能是实现这一目标的最快方式。像dtSearch这样的授权索引器需要花钱(不是很多),但有时候,与花费在编写自己的代码来执行相同操作的时间相比,它可能是值得花费的。

如果您不想使用索引器,我发现的某些文章可能会引导您朝着正确的方向前进:

http://omegacoder.com/?p=555

http://weblogs.asp.net/guystarbuck/archive/2008/05/13/automated-search-and-replace-in-multiple-word-2007-documents-with-c.aspx

修改 要查找包含特定字词的句子,您可以尝试此链接http://msdn.microsoft.com/en-us/library/bb546163.aspx

答案 1 :(得分:1)

答案 2 :(得分:1)

Office Interop是一个选项但要注意:MS在类似服务器的场景(如ASP.NET或Windows服务或类似场景)中不支持 - 请参阅http://support.microsoft.com/default.aspx?scid=kb;EN-US;q257757#kb2

您需要使用一些库来实现您的目标: