在Ruby / Rails中测试所有语言的正则表达式中的单词字符

时间:2013-10-18 16:26:35

标签: ruby-on-rails ruby regex unicode utf-8

我知道我可以在Ruby的正则表达式中将单词字符与\w匹配:

2.0.0p247 :003 > /[\w]+/.match('hi')                                                                                                                                               
 => #<MatchData "hi">                                                                                                                                                              

但是,据我了解,这只匹配[a-zA-Z0-9_]。我还想匹配其他语言中标准单词中出现的字符。有一个简单的方法吗?

更新 :好像我可能在POSIX括号表达式中找到了答案:

/[[:alnum:]]/ - Alphabetic and numeric character
/[[:alpha:]]/ - Alphabetic character

这就是我要找的东西吗?

1 个答案:

答案 0 :(得分:0)

是。肯定在:alpha:的正确轨道上这是(https://stackoverflow.com/a/3879835/499581)的区域设置示例:

/\A[[:alpha:]]+\Z/

对于某些标点符号,请考虑使用:

/[[:punct:]]/

more here