标签: ruby regex
@raw_array[i]=~/[\W]/
非常简单的正则表达式。 当我尝试使用一些非拉丁字母(俄语具体)时,条件是错误的。
我该怎么办?
答案 0 :(得分:8)
@raw_array[i] =~ /[\p{L}]/
使用西里尔字符进行测试。
参考:http://www.regular-expressions.info/unicode.html#prop
答案 1 :(得分:1)
来自Regexp documentation:
/\W/ - 非单词字符([^a-zA-Z0-9_])
/\W/
[^a-zA-Z0-9_]
它特别不支持Unicode。也许这样的事情对你来说会更好:
@raw_array[i]=~/[^[:word:]]/