java句子分裂错误

时间:2015-05-02 10:22:43

标签: java regex artificial-intelligence stanford-nlp text-segmentation

我想使用java语言从段落中分割句子。请考虑以下句子。

  

我们决定从我们办公室去u.s.a,加拿大,非洲等地。一世   只有10万卢比。所以我打电话给我爸爸,问了一些钱。他说   “不。我不会”并断开手机

我使用了stanford tokenizer。虽然句子we decided to go to u.s.a, canada,africa etc... from our office是单句,但输出显示

  我们决定去u.s.a,加拿大,非洲等......

是一句话

  

来自我们的办公室

是另一句话。其余句子正确分裂。

请注意:如果该字词为etc.,而非etc...,则表明其正常运行。

是否可以告诉程序,以下单词etc...是同一句话的延续? 我也尝试了其他一些句子分割工具。但结果是一样的。请帮忙。

1 个答案:

答案 0 :(得分:1)

使用替换功能替换...具有独特的功能。 * +& 1例如。然后拆分字符串,然后用...替换唯一的部分。