我想看一下使用Lucene为我目前管理的网站提供全文搜索解决方案。该站点完全基于SQL Server 2008 / C#.NET 4技术构建。我想要索引的数据实际上非常简单,每条记录只有几个字段,其中只有一个字段可以实际搜索。
我不清楚我需要使用的最佳工具集是什么,或者我应该使用的架构是什么。具体做法是:
我应该把索引放在哪里?我见过人们建议把它放在网络服务器上,但这对于大量的网络服务器来说似乎很浪费。当然,集中化会更好吗?
如果索引是集中的,我会如何查询它,因为它只存在于文件系统上?我是否必须将其有效地放在所有网络服务器都可以看到的网络共享上?
是否有任何预先存在的工具会按计划逐步填充Lucene索引,从SQL Server数据库中提取数据?在这里推销我自己的服务会更好吗?
当我查询索引时,我是否应该只是拉回一堆记录ID,然后我返回到DB以获取实际记录,或者我是否应该抓住我需要的所有内容直接搜索索引?
尝试在这个风味环境中实现像Solr这样的东西有价值吗?如果是这样,我可能会给它自己的* nix VM并在Tomcat中运行它。但在这种情况下,我不确定Solr会给我买什么。
答案 0 :(得分:50)