在8000 Ms word文件中查找字符串

时间:2013-04-23 08:01:47

标签: c# filestream

我使用FileStream在我的SQL数据库中存储了很多word文件,现在我想在所有这些文件中搜索返回那些包含字符串的女巫。

我找到的第一个解决方案是打开每个文件并读取它们的内容并搜索给定的字符串(使用文件流)

第二个解决方案是不使用FileStream并将word的内容存储在数据库中,因此这需要我们需要一个很大的空间!

有没有人可以帮我解决这个问题??

* UPDATE1 :我正在WPF中创建文档管理系统。此应用程序将在LAN上运行。有2个申请。第一个将安装在服务器上,用户将使用它添加或删除文件。第二部分将安装在客户端上,用户将使用它来搜索文件内容

* UPDATE2 :在所有人回答我的问题时,我发现SQL Server 2012的新功能名为File Table。这个可以帮助我吗?我想我可以使用这个和第三方解决方案来做到这一点?!你同意我的意见吗?!

3 个答案:

答案 0 :(得分:0)

最后我使用名为File Table的MSSQL 2012的新版本,因为它只支持.doc文件,我安装了Microsoft IFilter 2.0以支持.docx文件。还可以在我的文件表上创建全文索引,并且效果很好

答案 1 :(得分:-1)

我建议先使用第一个解决方案,因为首先你可以分配内存一次读取一个文件,完成后,释放内存并将内存分配给另一个文件并读取。在这个过程中,你可以返回所需的字符串,不需要很大的硬空间。

答案 2 :(得分:-1)

您的环境如何设置,您拥有什么样的数据库? 另一种解决方案可能涉及文件服务器Linux系统将文本内容存储到文件中。然后,您可以使用grep 'word' filename/s来快速获得结果。