在斯坦福大学NER培训中使用数字类作为功能

时间:2019-04-03 23:41:09

标签: stanford-nlp

我对CoreNER来说还很陌生,所以如果这很明显,请多包涵。

我需要训练斯坦福大学NER标记器,以识别对新闻中伤亡人数的提及。例如,在下面的句子中:

  

上周,有五人死于埃博拉病毒等。

字符串“五个人死亡”是对许多人员伤亡的提及。显然,在n-gram的开头存在一个数字,强烈表明它可能是一个伤亡数字。但是具体数字可能相差很大。

所以我正在考虑分两个阶段进行

  • 运行数字标签器
  • 运行一个CasulatyNumber标记器,该标记器将单词的“数字性”用作功能之一

CoreNER支持吗?如果是这样,应该在属性文件中设置哪些属性?

谢谢。

AlainDésilets

0 个答案:

没有答案