如何有效地实时搜索数以千计的文件

时间:2016-03-23 17:54:57

标签: c# sql-server full-text-search

我正在努力重构文档存储服务的站点,以便从专有存储系统转向SQL。一切都进行得很顺利,但我需要找到一种方法来搜索我们的存储库中的特定文本字符串。我们使用多种不同的文件类型(.xls,.xlsx,.doc,.txt等)。他们首先通过使用PDFSharp逐行重建将它们转换为PDF来向用户显示。

速度不是查看/搜索单个文件的考虑因素,但我担心可扩展性。我能够通过复制然后挂钩到我们的转换过程来进行有效的文本搜索,但我相当肯定这不适用于搜索客户的整个文档列表(成千上万的文档)。如果这些都是统一的文件类型,那么它可能更容易实现,但它们并非如此。

有没有一种有效的方法可以做到这一点我不知道?

编辑:文档存储在服务器上,并通过数据库中的文档URL进行引用

1 个答案:

答案 0 :(得分:1)

我的建议是在SQL或文件中构建索引。一个匹配文件与每个文件中所有可能的搜索条件。