与R中的任何汉字匹配的正则表达式是什么?
[\\p{Han}]
似乎无法正常工作。
v=c("a","b","c","中","e","文")
grep("[\\p{Han}]",v, value = TRUE)
[1] "a"
答案 0 :(得分:3)
根据regular-expressions.info,“ JGsoft引擎, Perl ,PCRE,PHP,Ruby 1.9,Delphi和XRegExp可以匹配Unicode脚本” 。因此,设置perl = T
应该会产生正确的结果。 R默认值是Ville Laurikari的TRE引擎(source)的修改版本:
grep("[\\p{Han}]", v, value = T, perl = T)
#### OUTPUT ####
[1] "中" "文"