我想使用pyNER库来从句子中提取名称。
我在我的ubuntu机器上安装了ner,然后我编写了以下脚本进行测试。
>>> import ner
>>> tagger = ner.HttpNER(host='localhost', port=80)
>>> tagger.json_entities("Alice went to the Museum of Natural History.")
通常,我必须得到这个输出:
'{"ORGANIZATION": ["Museum of Natural History"], "PERSON": ["Alice"]}'
但我一无所获:
{}
如何解决此问题?
谢谢,
答案 0 :(得分:1)
看起来存在问题(https://github.com/dat/pyner/issues/2)
要使其正常工作,您必须指定输出格式(slashTags):
tagger = ner.SocketNER(host='localhost',port=80, output_format='slashTags')
另外,我会考虑使用80以外的其他端口,因为它通常是为网络流量保留的。
如果这不起作用,请使用 SocketNER 而不是 HttpNER ,并按照NER常见问题解答
的说明进行操作http://nlp.stanford.edu/software/crf-faq.shtml#cc
cp stanford-ner.jar stanford-ner-with-classifier.jar
jar -uf stanford-ner-with-classifier.jar classifiers/english.all.3class.distsim.crf.ser.gz
java -mx500m -cp stanford-ner-with-classifier.jar edu.stanford.nlp.ie.NERServer -port 9191 -loadClassifier classifiers/english.all.3class.distsim.crf.ser.gz &
然后在你的python脚本中
import ner
tagger = ner.SocketNER(host='localhost',port=9191, output_format='slashTags')
print tagger.get_entities("University of California is located in California, United States")