StanfordCoreNLP newlineIsSentenceBreak无需删除\ n

时间:2018-05-31 09:37:29

标签: nlp stanford-nlp sentence

我有一个输入文字

我的名字是ramu \ n我25岁。

我使用StanfordCoreNLP来分割句子。

Properties props = new Properties();
props.put("annotators", "tokenize, ssplit, pos, lemma, ner, parse");
props.put("ssplit.newlineIsSentenceBreak", "always");
props.put("threads", "24");

这将我的文本分成两句话。

  1. 我的名字是ramu
  2. 我25岁。
  3. 但我需要保持\ n。 我的预期结果是

    1. 我的名字是ramu \ n
    2. 我25岁。
    3. 任何人都可以为此提出解决方案吗?

1 个答案:

答案 0 :(得分:0)

您可以查看附加到CoreLabel的{​​{3}}和BeforeAnnotation。这将为您提供给定标记之前和之后的空格,其中应包含换行符。在Simple API中,句子上的before()after()函数会返回这些函数。