如何从字符串中删除unicode <u + 2032>?

时间:2016-11-28 19:30:49

标签: r regex

我使用了this method,但它不起作用。 我的代码包括如下值:

clients <- c("Greg Smith <U+2032>", "John Coolman", "Mr. Brown <U+2032>")

所以我试过了:

clients <- gsub("$\\s*<U\\+\\w+>", "", clients)

但它不起作用。

3 个答案:

答案 0 :(得分:4)

clients <- gsub("[<].*[>]", "", clients)

答案 1 :(得分:2)

您的表达式的第一个字符有$。这匹配表达式的结尾,但前提是它是模式的最后一个字符:

> gsub("\\s*<U\\+\\w+>$", "", clients)
[1] "Greg Smith"   "John Coolman" "Mr. Brown"  

答案 2 :(得分:0)

如果您只想删除unicode <U+2032>

clients <- c("Greg Smith <U+2032>", "John Coolman", "Mr. Brown <U+2032>")
clients <- gsub("<U\\+2032>", "", clients)
clients
# [1] "Greg Smith "   "John Coolman" "Mr. Brown "