如何使用域特定短语的字典/模型来调整Retrieve和Rank排名?

时间:2016-04-18 18:41:10

标签: ibm-watson retrieve-and-rank

我们正在尝试将短语组合在一起以改善结果。

例如,如果用户询问“我什么时候需要更换空调过滤器?”之类的问题。使用诸如“空调”之类的特定于域的短语,R& R返回包含术语“空气”而没有“调节”的一些答案,或者它返回包含诸如气囊或空气过滤器之类的其他术语的答案。

这可以使用原始Solr实例来完成,并在引号之间设置短语。因此,Solr查询将如下所示:

...     
"debug": {
    "rawquerystring": "When do I have to change the filter of my \"air conditioning\" ?",
    "querystring": "When do I have to change the filter of my \"air conditioning\" ?",
    "parsedquery": "text:when text:do text:i text:have text:to text:change text:the text:filter text:of text:my PhraseQuery(text:\"air conditioning\") text:?",
    "parsedquery_toString": "text:when text:do text:i text:have text:to text:change text:the text:filter text:of text:my text:\"air conditioning\" text:?",      
...

然而,R&R guide州:

  

语法与标准Solr语法不同,如下所示:

     

您可以搜索单个字词或短语。你不需要   像Solr一样用双引号包围短语,但是你   可以在查询中包含短语,并由它们来计算   排名模型。

我们无法找到有关上述声明的更多详细信息。

但是,据我们了解,排名者应该识别短语。如果是这种情况,我们想知道是否有一种方法可以设置短语词典以调整排名? 或者,我们可以设置自己的法律短语模型吗?有什么方法可以实现这一目标?

由于

1 个答案:

答案 0 :(得分:3)

目前RnR并不支持严格的短语查询,但有一些功能需要考虑术语排序和相邻术语。我们正在开发一个新版本的服务,用户可以使用完整的常规solr查询语法(包括指定短语)进行文档检索。