标签: unicode grep
有没有办法确定知道特定的Unicode点是否匹配或者不是'\ w'(除了对我想知道的所有字符运行搜索)?它在英语中很简单,但在像高棉语这样的语言中却不那么明显,因为在单词中使用的字符显然与'\ w'不匹配。具体来说,有没有办法通过查看角色的官方Unicode描述来了解?
答案 0 :(得分:0)
标准grep可能无法使用-P或--perl-regexp选项处理unicode,GNU grep。
-P
--perl-regexp
grep -P '\p{L}'
否则\w匹配[0-9A-Za-z_]。
\w
[0-9A-Za-z_]