如何强制斯坦福命名实体识别器(NER)使用我的句子分隔符?

时间:2016-03-21 22:29:54

标签: stanford-nlp

Stanford NER工具包中是否有选项强制输出与输入具有相同的行分割?

我正在寻找类似斯坦福解析器中“-sentences newline”选项的东西。

1 个答案:

答案 0 :(得分:0)

如果你给出选项-tokenizerOptions "tokenizeNLs=true,tokenizePerLine=true",那么每一行都将被视为一个单独的句子,它应该给出你希望的结果 - 如果你使用像{{1这样的输出格式,它将被写成一行}或slashTags

CoreNLP还提供了一些逐行处理文本的选项。