我正在玩NLTK。我需要NER但是很多句话并不快。现在我的代码如下:
from nltk.tag import StanfordNERTagger
st = StanfordNERTagger(...)
for s in sents:
w_tokens = word_tokenize(s.strip())
ner_tags =st_ner.tag(w_tokens)
一句很漂亮。
输入:
巴拉克H.奥巴马是美国第44任总统。
输出:
[(' Barack',' PERSON'),(' H。',' PERSON'),(' ;奥巴马',' PERSON'),('',' O'),''''''' O'),(' 44th',' O'),('总统',' O'),&#39 ',' O'),''' O'),' United','位置'),('州','位置')
但是,我需要处理很多句子。我有chunk
之类的方法可以让我更快完成工作吗?