使用Stanford corenlp训练无壳NER模型

时间:2016-09-08 19:17:03

标签: stanford-nlp named-entity-recognition

我知道如何按照指定的here训练NER模型并且事实上非常成功。我也了解了所提到的3个无壳模型here。但是如果我想训练自己的无壳模型怎么办呢?那里有什么诀窍呢?我有很多用于培训的大写文档。我是否使用相同的培训过程,或者对于无壳模型是否有特殊/不同的功能,或者是否需要设置属性?我找不到关于如何创建所提供的无壳模型的描述。

1 个答案:

答案 0 :(得分:2)

我们的模型中只有一个属性更改,即您希望它在调用单词进行分类之前调用​​一个删除案例信息的函数。我们使用此属性值(也将某些单词映射到美式拼写)来执行此操作:

wordFunction = edu.stanford.nlp.process.LowercaseAndAmericanizeFunction

但也有简单的说法:

wordFunction = edu.stanford.nlp.process.LowercaseFunction

拥有更多用于决定文档格式(硬/软换行符),案例甚至语言的自动内容会很不错,但目前我们还没有其中任何一种......