使用正则表达式将字符串拆分成句子

时间:2015-06-11 23:43:12

标签: java regex string

我正试图将一个段落分成句子。目前我正在按.进行拆分工作正常,但是当.?!

到目前为止,我的代码是:

String[] sentences = everything.split("(?<=[a-z])\\.\\s+");

由于

2 个答案:

答案 0 :(得分:2)

如果您不想从结果中删除.!?

    String[] sentences = everything.split("(?<=[a-z][!?.])\\s+"); 

答案 1 :(得分:0)

使用角色类,你不需要背后的外观 - 改为使用单词边界:

String[] sentences = everything.split("\\b[.!?]\\s+");

"[.!?]"表示&#34; .!?&#34;。单词边界\b要求单词字符在句子结尾之前。