在Java中使用正则表达式拆分字符串

时间:2014-05-30 19:17:27

标签: java regex

我想创建自己的模式以使用正则表达式分割String。

实际上我想将一个字符串拆分成句子,所以我需要一个类似"的模式。 \ p {上}" 我尝试过编码,但java并不接受它:

String[] phrase = txtbrut.split(". \p{Upper}");

基本上我需要用以下模式拆分文本String:dot-space-CapitalLetter

如果有人知道如何创建自己的模式。

1 个答案:

答案 0 :(得分:0)

要将字符串拆分为句子,您可以

String[] sentences = txtbrut.split("\\. (?=\\p{Upper})");

根据Stephan's comment注意,这不会处理缩写和省略号出现的情况