我正在使用Solrj为Solr服务器构建查询。
所以我有一些很短的自由格式文本,可以包含各种特殊字符 - 比如Mr. John's New-Wall, "Hotels & Food"
。
对此类文本的短语查询不会产生足够的匹配。因此,在本文中,我想提取用于构建简单查询的术语,例如content:Mr OR content:John's OR content:Hotels OR content:Food
。 (以某种方式考虑接近度这个术语可能会很好,但我必须从某事开始)。
我正在搜索的字段是默认的text_general
字段。我开始用空格替换一些特殊字符并将它们拆分以提取术语。但这感觉有点多余。
使用Solrj和Solr,是否有更简单的方法从文本中提取术语?基本上我想从文本中提取术语,类似于Solr在创建索引时如何完成。
答案 0 :(得分:0)
我不确定你的问题到底是什么,但是这里有一些你可能会觉得有用的信息:
基本上我想从文本中提取术语,类似于Solr在创建索引时如何完成。
您可以在架构中配置索引和查询字段处理。我建议你看看这里。这为您提供了一些标准化数据的灵活性。
因此,在本文中,我想提取构建简单查询的术语,例如内容:Mr OR内容:John的OR内容:酒店或内容:食物。
这是solr查询的默认方式。我建议你查找edismax查询解析器和qf和tie参数。
希望有所帮助