如何在REGEX(Android / Java)中按ASCII字符组拆分
实际字符串
“আমিআছি我是ইংরেজিথেকেথেকোংলা”
预期输出
আমিআছি
我是
ইংরেজিথেকেথেকোংলা
答案 0 :(得分:2)
您可以随时拆分以下内容:
(?<=[\u0021-\u007E])\s+(?=[^\u0021-\u007E])|(?<=[^\u0021-\u007E])\s+(?=[\u0021-\u007E])
这会在以标准拉丁字符开头的空格上分开,然后是不标准拉丁字符或 而不是标准拉丁字符后跟一个标准的拉丁字符。当然,您可以通过查看here作为参考来修改接受的unicode范围。