据我所知,斯坦福大学NER有3,4和7级模型(或标签)。 我需要一个名称实体识别器的标准和Java实现,它有超过7个标签(例如13个标签)。我不想自己开发它,我需要它准确。有没有满足这些条件的NER?
由于
答案 0 :(得分:1)
斯坦福NER系统可以针对任意数量的标签进行重新训练。 3,4和7级车型只是预先训练过的车型。如果您想在更多课程上进行培训,您必须收集其中课程的培训数据,并重新培训模型。
答案 1 :(得分:1)
Python nltk包提供命名实体识别(NER),它有一个构建分类器。它有超过7个类。
ORGANIZATION - Georgia-Pacific Corp., WHO
PERSON - Eddy Bonte, President Obama
LOCATION - Murray River, Mount Everest
DATE - June, 2008-06-29
TIME - two fifty a m, 1:30 p.m.
MONEY - 175 million Canadian Dollars, GBP 10.40
PERCENT - twenty pct, 18.75 %
FACILITY - Washington Monument, Stonehenge
GPE - South East Asia, Midlothian
您使用的是Java
,因此java
中有一个等效的包OpenNLP。您可以在OpenNLP
中查看分类器。
以下是证明OpenNLP
相当于nltk