在JavaScript中,我们可以使用Unicode转义序列匹配单个Unicode代码点或代码点范围,例如:
"A".match(/\u0041/) // => ["A"]
"B".match(/[\u0041-\u007A]/) // => ["B"]
但是我们如何创建一个正则表达式来匹配一个正确的名称,该名称必须包含使用JavaScript正则表达式的任何Unicode“字母”?有一系列字母吗? JavaScript中的特殊正则表达式序列或字符类?
假设我的网站必须验证可能使用拉丁语言的名称,以及希伯来语,西里尔语,日语(片假名,平假名等)在JavaScript中是可行的,或者是委托后端语言的唯一理智选择更好的Unicode支持?
答案 0 :(得分:5)
这是一个JS插件,它为RegEx添加了Unicode支持
答案 1 :(得分:0)
我用于定义此网站http://www.fileformat.info的符号的unicode。
Unicode块(Basic Latin,。+,Cyrillic,。+,Arabic和其他): http://www.fileformat.info/info/unicode/block/index.htm
Unicode字符类别(这在JS中不起作用): http://www.fileformat.info/info/unicode/category/index.htm
来信(A-я): http://www.fileformat.info/info/unicode/char/a.htm
字体(每种字体支持字符): http://www.fileformat.info/info/unicode/font/index.htm