标签: nltk named-entity-recognition tagged-corpus
我正在使用nltk进行命名实体识别。默认的ne_chunk函数使用ACE Corpus进行分块和命名实体识别。
chunked = ne_chunk(pos_tag(word_tokenize(text)))
我想知道是否可以使用诸如Treebank语料库之类的不同标记语料库来执行命名实体识别?我知道可以导入树库语料库
来自nltk.corpus导入树库
在使用ne_chunk函数搜索命名实体时,是否可以使用该语料库?