为QAnswering NLP交替映射诸如Weight to Mass之类的术语

时间:2013-01-16 20:56:34

标签: nlp information-retrieval synonym

我一直在使用C#中的Question Answering引擎。我已经实现了大多数现代系统的功能,并取得了良好的效果。尽管有Wordnet的帮助,我还无法解决的一个问题是将用户输入更改为正确的术语。

例如

changing Weight -> Mass
changing Tall   -> Height

我的问题是存在某种资源,可以帮助我完成将条款更改为正确术语的任务。

谢谢

2 个答案:

答案 0 :(得分:0)

我知道如何有效地做到这一点的唯一方法需要有大量的用户查询会话和会话的快乐度量,然后找到将词x替换为词y(可能给出一些上下文z)之间的相关性用户幸福。

以下是关于generating query substitutions的合理论文。

这是一篇关于generating synonyms from anchor text的新论文,它不需要查询日志。

答案 1 :(得分:0)

查看WordNet中MassWeight的所有同义词集,我可以看到没有共享的synset,因此没有共同的含义。实际上具有相同含义的词可以通过它们的synset标签进行匹配,因为我相信你已经意识到了。

在我自己的自然语言引擎(http://nlp.abodit.com)中,我允许用户在他们定义的语法中使用任何synset标签,但在这种情况下我仍会创建两个单独的语法规则,一个识别有关的问题质量和一个承认重量的问题。

但是,Wordnet也有一些文件可以为您提供同义词之间的类关系。例如,如果在我的演示页面中键入“define mass”,您将看到: -

4. wn30:synset-mass-noun-1
the property of a body that causes it to have weight in a gravitational field
--type--> wn30:synset-fundamental_quantity-noun-1
--type--> wn30:synset-physical_property-noun-1
ITokenText, IToken, INoun, Singular 

如果你对'体重'做同样的事情,你也会发现它与“物质财产”也有阶级关系。

在我的系统中,您可以编写一个规则来识别关于“物理属性”的问题,也可能是一个命名对象,然后尝试找出他们可能会询问的物理属性。而且,也许,如果你不能匹配,也许只是告诉他们所有关于物体的物理属性。

我系统中的方法签名就像......

 ... QuestionAboutPhysicalProperties (... IPhysicalProperty prop,
                                          INamedObject obj, ...)

...在代码中我会查看obj的属性并尝试找到一个名为'prop'的文件。