定制stanford corenlp包

时间:2014-10-15 11:55:03

标签: python nlp analytics stanford-nlp

我正在使用stanford corenlp的python版本,该版本使用jsonrpc客户端/服务器逻辑。 - link

使用此软件包时,我得到以下结果(结果用于共参考分辨率)

Sentence - Bill Gates is richest person, he is also good by nature

结果:

Coreference set:
    (1,5,[4,13]) -> (1,2,[1,3]), that is: "richest person , he is also good by nature" -> "Bill Gates"
    (1,5,[4,6]) -> (1,2,[1,3]), that is: "richest person" -> "Bill Gates"
    (1,7,[7,8]) -> (1,2,[1,3]), that is: "he" -> "Bill Gates"

最初,我认为通过推荐实体替换推荐实体会给我一个解决的句子。但是看看上面的结果,我认为这个想法并不总是有效。

所以我想如果引用实体是我的代名词,你,他,她,它,我们,他们。然后只替换它。所以上面的句子现在将导致

Bill Gates is richest person, Bill Gates is also good by nature

我想知道,我可以自定义stanford包来执行此操作并获得此包的结果吗?

请考虑这个说明:

  

它在一个单独的过程中运行Stanford CoreNLP jar,进行通信   与java进程使用其命令行界面,并使   关于解析器输出的假设,以便将其解析为   Python dict对象并使用JSON传输它。解析器会中断   如果输出显着变化,但它已在Core上测试过   NLP工具版本3.4.1于2014-08-27发布。

0 个答案:

没有答案