我正在尝试在我的数据上使用Stanford CoreNLP POS标记。
我使用了自动生成的prop文件。我只更改了Open类。
我想知道是否有关于此属性中其他字段的完整描述,例如“arch”及其可能的值,“closedClassTagThreshold”,“minFeatureThresh”,“curWordMinFeatureThresh”,“rareWordMinFeatureThresh”,...
当我运行代码来标记文本时,它会选择在训练数据集中具有最小量的标记。为了更清楚,旅行被标记为/动词/ 10次,但作为/名词/ 20次。它总是选择重复较少的标签。