我想创建自己的模式以使用正则表达式分割String。
实际上我想将一个字符串拆分成句子,所以我需要一个类似"的模式。 \ p {上}" 我尝试过编码,但java并不接受它:
String[] phrase = txtbrut.split(". \p{Upper}");
基本上我需要用以下模式拆分文本String:dot-space-CapitalLetter
如果有人知道如何创建自己的模式。
答案 0 :(得分:0)
要将字符串拆分为句子,您可以
String[] sentences = txtbrut.split("\\. (?=\\p{Upper})");
根据Stephan's comment注意,这不会处理缩写和省略号出现的情况