我想使用java
语言从段落中分割句子。请考虑以下句子。
我们决定从我们办公室去u.s.a,加拿大,非洲等地。一世 只有10万卢比。所以我打电话给我爸爸,问了一些钱。他说 “不。我不会”并断开手机
我使用了stanford tokenizer
。虽然句子we decided to go to u.s.a, canada,africa etc... from our office
是单句,但输出显示
我们决定去u.s.a,加拿大,非洲等......
是一句话
来自我们的办公室
是另一句话。其余句子正确分裂。
请注意:如果该字词为etc.,
而非etc...
,则表明其正常运行。
是否可以告诉程序,以下单词etc...
是同一句话的延续?
我也尝试了其他一些句子分割工具。但结果是一样的。请帮忙。
答案 0 :(得分:1)
使用替换功能替换...具有独特的功能。 * +& 1例如。然后拆分字符串,然后用...替换唯一的部分。