斯坦福标记制作出意想不到的结果

时间:2016-05-14 08:47:52

标签: nlp stanford-nlp pos-tagger maxent

我正在尝试在我的数据上使用Stanford CoreNLP POS标记。

我使用了自动生成的prop文件。我只更改了Open类。

我想知道是否有关于此属性中其他字段的完整描述,例如“arch”及其可能的值,“closedClassTagThreshold”,“minFeatureThresh”,“curWordMinFeatureThresh”,“rareWordMinFeatureThresh”,...

当我运行代码来标记文本时,它会选择在训练数据集中具有最小量的标记。为了更清楚,旅行被标记为/动词/ 10次,但作为/名词/ 20次。它总是选择重复较少的标签。

0 个答案:

没有答案