从文本中提取查询术语以查询Solr服务器

时间:2015-06-08 13:32:18

标签: solr solrj

我正在使用Solrj为Solr服务器构建查询。

所以我有一些很短的自由格式文本,可以包含各种特殊字符 - 比如Mr. John's New-Wall, "Hotels & Food"

对此类文本的短语查询不会产生足够的匹配。因此,在本文中,我想提取用于构建简单查询的术语,例如content:Mr OR content:John's OR content:Hotels OR content:Food。 (以某种方式考虑接近度这个术语可能会很好,但我必须从某事开始)。

我正在搜索的字段是默认的text_general字段。我开始用空格替换一些特殊字符并将它们拆分以提取术语。但这感觉有点多余。

使用Solrj和Solr,是否有更简单的方法从文本中提取术语?基本上我想从文本中提取术语,类似于Solr在创建索引时如何完成。

1 个答案:

答案 0 :(得分:0)

我不确定你的问题到底是什么,但是这里有一些你可能会觉得有用的信息:

  

基本上我想从文本中提取术语,类似于Solr在创建索引时如何完成。

您可以在架构中配置索引和查询字段处理。我建议你看看这里。这为您提供了一些标准化数据的灵活性。

  

因此,在本文中,我想提取构建简单查询的术语,例如内容:Mr OR内容:John的OR内容:酒店或内容:食物。

这是solr查询的默认方式。我建议你查找edismax查询解析器和qf和tie参数。

希望有所帮助