Stanford NER工具包中是否有选项强制输出与输入具有相同的行分割?
我正在寻找类似斯坦福解析器中“-sentences newline”选项的东西。
答案 0 :(得分:0)
如果你给出选项-tokenizerOptions "tokenizeNLs=true,tokenizePerLine=true"
,那么每一行都将被视为一个单独的句子,它应该给出你希望的结果 - 如果你使用像{{1这样的输出格式,它将被写成一行}或slashTags
。
CoreNLP还提供了一些逐行处理文本的选项。