如何在Ruby中拆分字符串按Unicode范围。我想用逗号分隔\ u1000和\ u1000。例如,我想拆分这个字符串......
我爱ျမန္မာ
到此......
我爱,ျမန္မာ
您可能在我的示例中看不到Unicode字符。这是Unicode范围\ u1000及以上。
感谢。
答案 0 :(得分:2)
取决于您使用的是哪个版本;这是1.9的解决方案。我想1.8可能会变丑。
这取决于优雅,但似乎有效。
"I love ျမန္မာ".gsub(/([\u0000-\u0999])([\u1000-\u9999])/, '\1,\2')
如果这种方法合适,你必须提供另一种情况(从高到低的过渡)