命名实体识别用更少的时间:NLTK

时间:2018-01-22 16:24:50

标签: nlp nltk named-entity-recognition

我正在玩NLTK。我需要NER但是很多句话并不快。现在我的代码如下:

from nltk.tag import StanfordNERTagger   
st = StanfordNERTagger(...)
for s in sents:
    w_tokens = word_tokenize(s.strip())
    ner_tags =st_ner.tag(w_tokens)

一句很漂亮。

输入:

  巴拉克H.奥巴马是美国第44任总统。

输出:

  

[(' Barack',' PERSON'),(' H。',' PERSON'),(' ;奥巴马',' PERSON'),('',' O'),''''''' O'),(' 44th',' O'),('总统',' O'),&#39 ',' O'),''' O'),' United','位置'),('州','位置')

但是,我需要处理很多句子。我有chunk之类的方法可以让我更快完成工作吗?

0 个答案:

没有答案