使用python-nltk请求Anaphora解析示例

时间:2014-05-30 00:45:12

标签: python nltk

我一直在研究nltk-drt的方法和nltk.sem.drt的模块定义,但我很难理解如何使用这些软件包来实现基本功能。

我想要实现的任务示例如下:给出句子

  

Google是最大的科技公司之一。它雇用了很多人。

我希望能够编写一个小函数来解析这样的句子,并返回一个句子,如

  

Google是最大的科技公司之一。谷歌员工很多人。

更现实的测试用例可能类似于

  汤姆,迪克和哈利被邀请参加她的聚会,但拒绝了。这让雪莉很生气。

正在解决

  汤姆,迪克和哈利被邀请参加雪利酒派对,但拒绝了。这让雪莉很生气。

1 个答案:

答案 0 :(得分:11)

我不认为DRT(话语表征理论)与anaphora resolution有关,就像你想要的那样。它涉及在形式逻辑中表示句子的含义。

此外,您的"更真实的测试用例"有一个名称,称为" cataphora"。

Anaphora解析很困难,但您可以尝试Stanford DCoref

在此处查看一些示例:Anaphora resolution using Stanford Coref