应用错误收集

如何从连接器标点符号（ Pc ）类别获取像x-y\uxxxx\Uxxxxxxxxx这样的代码点模式，用于扫描ECMAScript 3 / JavaScript标识符？

原始问题

我需要帮助来验证词法扫描程序的ECMA-262（3º edition，7.6）标识符的有效字符（代码点）。

语法引用

Identifier ::



IdentifierName但不是ReservedWord


IdentifierName ::


IdentifierStart

IdentifierName IdentifierPart

IdentifierStart ::

UnicodeLetter

的 $

的 _

~~\ UnicodeEscapeSequence~~ ＃无需查看


IdentifierPart ::


IdentifierStart

UnicodeCombiningMark

UnicodeDigit

UnicodeConnectorPunctuation


UnicodeLetter ::


Unicode类别中的任何字符“大写字母（ Lu ）”，“小写＆gt;信（ Ll ）“，”标题字母（ Lt ）“，   “修饰符字母（ Lm ）”，“其他字母（ Lo ）”或“字母编号   （的 NL ）”。


UnicodeCombiningMark ::


Unicode类别中的任何字符“非间距标记（ Mn ）”或“组合间距标记（ Mc ）”


UnicodeDigit ::


Unicode类别中的任何字符“十进制数字（ Nd ）”


UnicodeConnectorPunctuation ::


Unicode类别中的任何字符“连接符标点符号（ Pc ）”

如您所见，它需要某些类别的任何特征。

我需要拥有所有这些可能的角色，所以我的第一步是找到＆＃34;连接符标点＆＃34;在这个Unicode 5.0 chart，但0匹配，我相信我做错了。有人可以帮助我吗？

如何从特定类别中获取所有Unicode字符？

原始问题

1 个答案: