标签: stanford-nlp
我对CoreNER来说还很陌生,所以如果这很明显,请多包涵。
我需要训练斯坦福大学NER标记器,以识别对新闻中伤亡人数的提及。例如,在下面的句子中:
上周,有五人死于埃博拉病毒等。
字符串“五个人死亡”是对许多人员伤亡的提及。显然,在n-gram的开头存在一个数字,强烈表明它可能是一个伤亡数字。但是具体数字可能相差很大。
所以我正在考虑分两个阶段进行
CoreNER支持吗?如果是这样,应该在属性文件中设置哪些属性?
谢谢。
AlainDésilets