正则表达式匹配R中的任何汉字

时间:2019-06-23 10:52:40

标签: r regex

与R中的任何汉字匹配的正则表达式是什么?

[\\p{Han}]似乎无法正常工作。

v=c("a","b","c","中","e","文")
grep("[\\p{Han}]",v, value = TRUE)

[1] "a"

1 个答案:

答案 0 :(得分:3)

根据regular-expressions.info“ JGsoft引擎, Perl ,PCRE,PHP,Ruby 1.9,Delphi和XRegExp可以匹配Unicode脚本” 。因此,设置perl = T应该会产生正确的结果。 R默认值是Ville Laurikari的TRE引擎(source)的修改版本:

grep("[\\p{Han}]", v, value = T, perl = T)

#### OUTPUT ####

[1] "中" "文"