将Unicode“名称”与JavaScript正则表达式匹配

时间:2011-04-06 18:18:22

标签: javascript regex unicode character-properties

在JavaScript中,我们可以使用Unicode转义序列匹配单个Unicode代码点或代码点范围,例如:

"A".match(/\u0041/) // => ["A"]
"B".match(/[\u0041-\u007A]/) // => ["B"]

但是我们如何创建一个正则表达式来匹配一个正确的名称,该名称必须包含使用JavaScript正则表达式的任何Unicode“字母”?有一系列字母吗? JavaScript中的特殊正则表达式序列或字符类?

假设我的网站必须验证可能使用拉丁语言的名称,以及希伯来语,西里尔语,日语(片假名,平假名等)在JavaScript中是可行的,或者是委托后端语言的唯一理智选择更好的Unicode支持?

2 个答案:

答案 0 :(得分:5)

这是一个JS插件,它为RegEx添加了Unicode支持

http://xregexp.com/plugins/

答案 1 :(得分:0)

我用于定义此网站http://www.fileformat.info的符号的unicode。

Unicode块(Basic Latin,。+,Cyrillic,。+,Arabic和其他): http://www.fileformat.info/info/unicode/block/index.htm

Unicode字符类别(这在JS中不起作用): http://www.fileformat.info/info/unicode/category/index.htm

来信(A-я): http://www.fileformat.info/info/unicode/char/a.htm

字体(每种字体支持字符): http://www.fileformat.info/info/unicode/font/index.htm

以上所有指数 http://www.fileformat.info/info/unicode/index.htm