我正在使用stanford corenlp的python版本,该版本使用jsonrpc客户端/服务器逻辑。 - link
使用此软件包时,我得到以下结果(结果用于共参考分辨率)
Sentence - Bill Gates is richest person, he is also good by nature
结果:
Coreference set:
(1,5,[4,13]) -> (1,2,[1,3]), that is: "richest person , he is also good by nature" -> "Bill Gates"
(1,5,[4,6]) -> (1,2,[1,3]), that is: "richest person" -> "Bill Gates"
(1,7,[7,8]) -> (1,2,[1,3]), that is: "he" -> "Bill Gates"
最初,我认为通过推荐实体替换推荐实体会给我一个解决的句子。但是看看上面的结果,我认为这个想法并不总是有效。
所以我想如果引用实体是我的代名词,你,他,她,它,我们,他们。然后只替换它。所以上面的句子现在将导致
Bill Gates is richest person, Bill Gates is also good by nature
我想知道,我可以自定义stanford包来执行此操作并获得此包的结果吗?
请考虑这个说明:
它在一个单独的过程中运行Stanford CoreNLP jar,进行通信 与java进程使用其命令行界面,并使 关于解析器输出的假设,以便将其解析为 Python dict对象并使用JSON传输它。解析器会中断 如果输出显着变化,但它已在Core上测试过 NLP工具版本3.4.1于2014-08-27发布。