文档系统中存储的文档ASP .Net应用程序中所需的文本搜索和过滤

时间:2009-12-15 12:16:20

标签: asp.net indexing search-engine

我们正在构建一个jobsite应用程序,我们将在其中存储所有候选者的简历,这些简历计划存储在文件系统中。

现在我们需要在该文件中搜索并将结果提供给用户,我们需要提供实现文本搜索的最佳解决方案。

我刚刚尝试识别它并获得了一些参考,如IFilter(API或接口)和Lucene.Net(开源),但不确定它是否是正确的解决方案。

在初始阶段,预计将有大约50,000份简历,如果数量增加,它应该足够可扩展。

我只想要一些案例研究或一些分析或您的建议,这是处理此要求的最佳方法(技术ASP .Net)

由于

3 个答案:

答案 0 :(得分:0)

您可以使用Microsoft Search Server。有一个免费版本,所以你可以在购买之前试用它(或者如果它符合你的要求就永远不买)。

如果以后确实想要将这些文档集成到Sharepoint门户中,企业搜索也可以与它集成。

答案 1 :(得分:0)

一种可能性是使用SQL Server 2008中的FILESTREAM功能,并结合数据库级全文索引/搜索。

这将允许您将文件保留在文件系统中,同时还提供事务完整性和搜索。

SQL Express支持FILESTREAM,4GB大小限制不适用于文件(尽管它适用于全文索引的大小)。

答案 2 :(得分:0)

这可能是天真的,因为我不熟悉现成的搜索产品,但如果没有任何预先构建适合该帐单,我将构建一个抓取和索引的简单服务(或几个实例来抓取不同的目录以提高速度)并更新数据库。如果定期访问文件,您可以构建一个隔离层以防止冲突。

罗德尼