如何匹配和拆分REGEX

时间:2014-01-31 15:17:39

标签: java android regex split

如何在REGEX(Android / Java)中按ASCII字符组拆分

实际字符串
“আমিআছি我是ইংরেজিথেকেথেকোংলা”

预期输出
আমিআছি
我是 ইংরেজিথেকেথেকোংলা

1 个答案:

答案 0 :(得分:2)

您可以随时拆分以下内容:

(?<=[\u0021-\u007E])\s+(?=[^\u0021-\u007E])|(?<=[^\u0021-\u007E])\s+(?=[\u0021-\u007E])

这会在以标准拉丁字符开头的空格上分开,然后是标准拉丁字符 而不是标准拉丁字符后跟一个标准的拉丁字符。当然,您可以通过查看here作为参考来修改接受的unicode范围。