Lucene搜索嵌入在文本中的关键字

时间:2013-07-11 20:03:02

标签: lucene

以下是我的问题陈述。请通过Lucene 4.3.1告诉我如何实现这一目标。我确实查看了不同的默认查询,但似乎没有任何符合我的要求。 如果在Lucene中无法做到这一点,是否有任何其他软件可以帮助我实现这一目标。另请注意,我有一个非常严格的周转时间,所以搜索需要很快完成。我在最大值时看大约10毫秒

我有一个名字列表的文件(格式 - “名字”“中间名”“姓氏”),可能是10K左右。必须对这些名称编制索引,以便我可以搜索传入的查询。

例如

将被编入索引的名称列表

  • 前M名
  • First MI Last
  • First N Las
  • 和其他一些名字

案例1: 下面的查询应该从索引

返回First M Last
  • 你好,你今天怎么做First M
  • 你好,你今天如何做最后一个M
  • 你好,你今天是怎么做Lst M的第一次

案例2: 以下查询不应返回任何内容。请注意,名称之间还有其他文本。

  • 你好,你是怎么做的第一篇文章M一些文字去年

案例3: 我也应该能够进行模糊搜索。下面的查询应该从索引返回First M Last。

  • 你好,你今天怎么做Ferst M
  • 你好,你今天怎么做Last Ferst M
  • 你好,你今天怎么做Last M Ferst

我尝试过接近查询,但由于输入非常随机,我无法使用它。

1 个答案:

答案 0 :(得分:0)

也许你运行像http://lucene.apache.org/solr/4_3_1/tutorial.html这样的索引服务并编写脚本以便用你的数据填充它并根据需要进行查询会更好。

请注意,您所说的查询对我来说看起来像是结果,因此不清楚您的期望是什么。通常情况下,您只会获得您输入的数据。