'en'模型的NER类型?

时间:2017-12-04 04:22:58

标签: python named-entity-recognition spacy

有没有办法在spaCy中获取所有内置和添加的自定义NER类型?建议here的方法似乎不再起作用。在尝试

nlp.entity.cfg 

我回来了,

{u'hist_size': 0, u'pretrained_dims': 0L, u'hist_width': 0, u'beam_density': 
0.0, u'cnn_maxout_pieces': 3, u'maxout_pieces': 2, u'hidden_depth': 1, 
u'token_vector_width': 128, u'nr_class': 73, u'beam_width': 1, 
u'hidden_width': 200}

此词典中没有'actions'和'extra_labels'键。

2 个答案:

答案 0 :(得分:3)

我找到了另一种方法。适用于 spacy v. 3.0.5:

ner = nlp.get_pipe('ner')
print(ner.labels)

它给出了结果:

('CARDINAL', 'DATE', 'EVENT', 'FAC', 'GPE', 'LANGUAGE', 'LAW', 'LOC', 'MONEY', 'NORP', 'ORDINAL', 'ORG', 'PERCENT', 'PERSON', 'PRODUCT', 'QUANTITY', 'TIME', 'WORK_OF_ART')

答案 1 :(得分:0)

不确定这是否是他们要完成的方式。我想出来了

nlp.entity.move_names

返回,

[u'B-PERSON', u'B-CARDINAL', u'B-ORG', u'B-GPE', u'B-FAC', u'B-MONEY', u'B-NORP', u'B-DATE', u'B-TIME', u'B-ORDINAL', u'B-PERCENT', u'B-PRODUCT', u'B-LANGUAGE', u'B-LOC', u'B-QUANTITY', u'B-WORK_OF_ART', u'B-EVENT', u'B-LAW', u'I-PERSON', u'I-CARDINAL', u'I-ORG', u'I-GPE', u'I-FAC', u'I-MONEY', u'I-NORP', u'I-DATE', u'I-TIME', u'I-ORDINAL', u'I-PERCENT', u'I-PRODUCT', u'I-LANGUAGE', u'I-LOC', u'I-QUANTITY', u'I-WORK_OF_ART', u'I-EVENT', u'I-LAW', u'L-PERSON', u'L-CARDINAL', u'L-ORG', u'L-GPE', u'L-FAC', u'L-MONEY', u'L-NORP', u'L-DATE', u'L-TIME', u'L-ORDINAL', u'L-PERCENT', u'L-PRODUCT', u'L-LANGUAGE', u'L-LOC', u'L-QUANTITY', u'L-WORK_OF_ART', u'L-EVENT', u'L-LAW', u'U-PERSON', u'U-CARDINAL', u'U-ORG', u'U-GPE', u'U-FAC', u'U-MONEY', u'U-NORP', u'U-DATE', u'U-TIME', u'U-ORDINAL', u'U-PERCENT', u'U-PRODUCT', u'U-LANGUAGE', u'U-LOC', u'U-QUANTITY', u'U-WORK_OF_ART', u'U-EVENT', u'U-LAW', u'O']

这也显示了添加到模型中的任何其他自定义实体,例如您的电子邮件'就我而言:

[u'B-PERSON', u'B-CARDINAL', u'B-ORG', u'B-GPE', u'B-FAC', u'B-MONEY', u'B-NORP', u'B-DATE', u'B-TIME', u'B-ORDINAL', u'B-PERCENT', u'B-PRODUCT', u'B-LANGUAGE', u'B-LOC', u'B-QUANTITY', u'B-WORK_OF_ART', u'B-EVENT', u'B-LAW', u'I-PERSON', u'I-CARDINAL', u'I-ORG', u'I-GPE', u'I-FAC', u'I-MONEY', u'I-NORP', u'I-DATE', u'I-TIME', u'I-ORDINAL', u'I-PERCENT', u'I-PRODUCT', u'I-LANGUAGE', u'I-LOC', u'I-QUANTITY', u'I-WORK_OF_ART', u'I-EVENT', u'I-LAW', u'L-PERSON', u'L-CARDINAL', u'L-ORG', u'L-GPE', u'L-FAC', u'L-MONEY', u'L-NORP', u'L-DATE', u'L-TIME', u'L-ORDINAL', u'L-PERCENT', u'L-PRODUCT', u'L-LANGUAGE', u'L-LOC', u'L-QUANTITY', u'L-WORK_OF_ART', u'L-EVENT', u'L-LAW', u'U-PERSON', u'U-CARDINAL', u'U-ORG', u'U-GPE', u'U-FAC', u'U-MONEY', u'U-NORP', u'U-DATE', u'U-TIME', u'U-ORDINAL', u'U-PERCENT', u'U-PRODUCT', u'U-LANGUAGE', u'U-LOC', u'U-QUANTITY', u'U-WORK_OF_ART', u'U-EVENT', u'U-LAW', u'O', u'B-EMAIL', u'I-EMAIL', u'L-EMAIL', u'U-EMAIL']