我一直在研究nltk-drt的方法和nltk.sem.drt的模块定义,但我很难理解如何使用这些软件包来实现基本功能。
我想要实现的任务示例如下:给出句子
Google是最大的科技公司之一。它雇用了很多人。
我希望能够编写一个小函数来解析这样的句子,并返回一个句子,如
Google是最大的科技公司之一。谷歌员工很多人。
更现实的测试用例可能类似于
汤姆,迪克和哈利被邀请参加她的聚会,但拒绝了。这让雪莉很生气。
正在解决
汤姆,迪克和哈利被邀请参加雪利酒派对,但拒绝了。这让雪莉很生气。
答案 0 :(得分:11)
我不认为DRT(话语表征理论)与anaphora resolution有关,就像你想要的那样。它涉及在形式逻辑中表示句子的含义。
此外,您的"更真实的测试用例"有一个名称,称为" cataphora"。
Anaphora解析很困难,但您可以尝试Stanford DCoref
在此处查看一些示例:Anaphora resolution using Stanford Coref