我的任务是比较命名实体识别(NER)的不同方法。我遇到了斯坦福大学的coreNLP,这是一个很好的库来完成此任务。对于NER,有CRF和CMM分类器(以及朴素贝叶斯用于二进制分类)。
我的问题是我是否可以使用printFeatures
中的NERFeatureFactory
属性,以在不同的分类器(例如softmax分类器,并使用featureFormat
中的属性ColumnDataClassifier
来使用此功能文件来训练softmax分类器。
在特征生成方面,“ NERFeatureFactory”似乎更“先进”(例如引理生成,更好的ngram(“ ColumnDataClassifier”仅在有足够的令牌生成列的情况下才从列中生成ngram,而“ NERFeatureFactory'在下一行/上一行中显示,对吧?)。 我基本上想对所有分类器使用相同的功能。