在scala中训练新的StanfordCoreNLP标记时重复道具文件

时间:2017-11-09 00:22:51

标签: stanford-nlp

我尝试使用以下代码行训练新的StanfordCoreNLP标记:

MaxentTagger.main(Seq("-props", "src/resources/tagger/mycustom.tagger.props").toArray)

src/resources/tagger/mydata.txt内的数据文件。但是,道具文件的第二个副本神奇地出现在与src相同的级别。通过第二个副本,我的意思是完全相同,在文件中使用相同的自定义文件名和相同的自定义值。我尝试多次删除此文件,但它会不断重现。

或者,我尝试删除src/resources/tagger/文件中的一个,并仅使用与src相同级别的文件。但事情恰恰相反。当我尝试将训练过的模型保存在资源文件夹中时,会出现第二个道具文件副本。

1 个答案:

答案 0 :(得分:0)

这很正常。标记器将用于模型的属性的副本与模型一起存储为记录,并在需要时帮助重新创建培训过程。