Question

与R中的任何汉字匹配的正则表达式是什么？

[\\p{Han}]似乎无法正常工作。

v=c("a","b","c","中","e","文")
grep("[\\p{Han}]",v, value = TRUE)

[1] "a"

Answer 1

根据regular-expressions.info，“ JGsoft引擎， Perl ，PCRE，PHP，Ruby 1.9，Delphi和XRegExp可以匹配Unicode脚本” 。因此，设置perl = T应该会产生正确的结果。 R默认值是Ville Laurikari的TRE引擎（source）的修改版本：

grep("[\\p{Han}]", v, value = T, perl = T)

#### OUTPUT ####

[1] "中" "文"

正则表达式匹配R中的任何汉字

1 个答案: