有没有办法在生成的" Unicode Utilities:UnicodeSet "的结果集上应用降序。现场?我想降序,因为我会对此集合进行二元化并查看它,直到当前范围或代码点大于特定代码点(例如,知道某个字符是否是有效的ActionScript 3标识符部分)。
我把它。
[:age=2.1:]&[[:gc=Nd:][:gc=Mn:][:gc=Mc:][:gc=Pc:]]
它输出这个等效的集合......
[\u0591-\u05A1\u05A3-\u05AF\u05BD [more] \uFF3F\uFE4D-\uFE4F\uFE33\uFE34 [more] \u203F \u2040 0\u0660 [more] ]
正如您所看到的,有许多但不是太多的无序代码点。它包括无序的十进制数字。例如,U + 30( 0 ),它不是唯一与[0-9]
区别开来的十进制数字,与U + FF3F代码点的位置相比显得非常远
我得到的答案here为我提供了一个非常有效的模式。
[:age=5.0:]&[[:gc=L:][:gc=Nl:][:gc=Mn:][:gc=Mc:][:gc=Nd:][:gc=Pc:]\$_]
Unicode版本(5.0
)并不重要。只有当我删除L/Nl
类别和$_
符号时,它才会输出上述奇怪的集合。
有没有完成或模式解决方案?