使用nlpnet的SRL不适用于某些句子

时间:2014-04-21 14:46:18

标签: python nltk

我安装了nlpnet并下载了data。但它只适用于一些句子。我使用Ubuntu 13.04 32位和Python 2.7.4与virtualenv。

这里我发了两个例子,第一个似乎工作,第二个没有:

示例1(似乎工作):

python nlpnet-tag.py srl /path/to/nlpnet-data/
This is the first sentence of the paragraph. This is the second sentence of the paragraph.
This is the first sentence of the paragraph .
sentence
    A1: the paragraph
    A0: first
    V: sentence

This is the second sentence of the paragraph .
sentence
    A1: the paragraph
    A0: second
    V: sentence

示例2(不起作用):

这句话取自CoNLL-2005 Examples

python nlpnet-tag.py srl /path/to/nlpnet-data/
The $1.4 billion robot spacecraft faces a six-year journey to explore Jupiter and its 16 known moons.
The $ 1.4 billion robot spacecraft faces a six-year journey to explore Jupiter and its 16 known moons .

我也测试了python和tokenization,但是在调用arg_structures的第二个示例中,返回一个空列表。

我错过了什么? ...即使不使用nlpnet也能提供解决方案,我们将不胜感激。

由于

PS:我也reported this issue但是想看看是否有人帮我修理它。

1 个答案:

答案 0 :(得分:0)

包的作者erickrf,answer它:

  这里的问题是训练有素的模型   http://nilc.icmc.usp.br/nilc/download/nlpnet-data.zip接受了培训   葡萄牙语。它不会用英语工作。

     

当你获得一个空的arg_structures列表时,它意味着网络   并没有将任何令牌识别为谓词。