NER的标签数量

时间:2016-06-14 05:26:26

标签: java machine-learning nlp stanford-nlp named-entity-recognition

据我所知,斯坦福大学NER有3,4和7级模型(或标签)。 我需要一个名称实体识别器的标准和Java实现,它有超过7个标签(例如13个标签)。我不想自己开发它,我需要它准确。有没有满足这些条件的NER?

由于

2 个答案:

答案 0 :(得分:1)

斯坦福NER系统可以针对任意数量的标签进行重新训练。 3,4和7级车型只是预先训练过的车型。如果您想在更多课程上进行培训,您必须收集其中课程的培训数据,并重新培训模型。

答案 1 :(得分:1)

Python nltk包提供命名实体识别(NER),它有一个构建分类器。它有超过7个类。

ORGANIZATION - Georgia-Pacific Corp., WHO
PERSON - Eddy Bonte, President Obama
LOCATION - Murray River, Mount Everest
DATE - June, 2008-06-29
TIME - two fifty a m, 1:30 p.m.
MONEY - 175 million Canadian Dollars, GBP 10.40
PERCENT - twenty pct, 18.75 %
FACILITY - Washington Monument, Stonehenge
GPE - South East Asia, Midlothian   

您使用的是Java,因此java中有一个等效的包OpenNLP。您可以在OpenNLP中查看分类器。

以下是证明OpenNLP相当于nltk

的SO link