我在Lucene.NET上输入的文本数量是否有限制

时间:2012-03-20 15:37:11

标签: c# full-text-search lucene.net

在阅读SQL Server全文处理的一些不好评论后,我正在研究使用Lucene.NET。

我应该小心将我提供给Lucene.NET的数据索引吗?

另外,为避免额外的数据库调用,在索引中存储数据的最佳做法是什么,如条目ID,标题等?

编辑:这也解释了how much data lucene can handle

1 个答案:

答案 0 :(得分:2)

搜索驱动的网站现在并不罕见,搜索索引充当存储库/文档数据库,不仅在搜索时提供数据,而且还用于生成导航和/或方面。 Lucene非常适合这个目的,Solr甚至更好。将您的SQL数据库数据用作主数据,并以适合您的频率填充/重建索引。

索引越大,查询的速度就越慢,但Lucene在被索引大小负担之前可以吞下很多。

索引应包含所有可搜索的数据。如果您要为人们编制索引,这可能是他们的姓名和电子邮件地址。如果您还在索引中包含People实体所包含的所有属性,即使它们不可搜索,您也可以跳过触摸数据库。另一种方法是包括名称,电子邮件和peopleID,以及其他任何内容,并通过ID查询数据库以获取People实体。