Python PyNER库不提供任何输出

时间:2015-12-23 10:03:25

标签: python named-entity-recognition

我想使用pyNER库来从句子中提取名称。

我在我的ubuntu机器上安装了ner,然后我编写了以下脚本进行测试。

>>> import ner
>>> tagger = ner.HttpNER(host='localhost', port=80)
>>> tagger.json_entities("Alice went to the Museum of Natural History.")

通常,我必须得到这个输出:

'{"ORGANIZATION": ["Museum of Natural History"], "PERSON": ["Alice"]}'

但我一无所获:

{}

如何解决此问题?

谢谢,

1 个答案:

答案 0 :(得分:1)

看起来存在问题(https://github.com/dat/pyner/issues/2

要使其正常工作,您必须指定输出格式(slashTags):

tagger = ner.SocketNER(host='localhost',port=80, output_format='slashTags')

另外,我会考虑使用80以外的其他端口,因为它通常是为网络流量保留的。

如果这不起作用,请使用 SocketNER 而不是 HttpNER ,并按照NER常见问题解答

的说明进行操作

http://nlp.stanford.edu/software/crf-faq.shtml#cc

cp stanford-ner.jar stanford-ner-with-classifier.jar 
jar -uf stanford-ner-with-classifier.jar classifiers/english.all.3class.distsim.crf.ser.gz 
java -mx500m -cp stanford-ner-with-classifier.jar edu.stanford.nlp.ie.NERServer -port 9191 -loadClassifier classifiers/english.all.3class.distsim.crf.ser.gz &

然后在你的python脚本中

import ner
tagger = ner.SocketNER(host='localhost',port=9191, output_format='slashTags')
print tagger.get_entities("University of California is located in California, United States")