也许我不了解ascii的细微差别,但我无法从字符串中删除编码。
输入字符串为:
mystring<-"complications: noneco-morbidity:nil \\x0c\\\\xd6\\p__"
我想要的输出是:
"complications: noneco-morbidity:nil __"
我的尝试是:
iconv(x, "latin1", "ASCII", sub = "")
但没有删除任何内容
答案 0 :(得分:1)
将以下模式用作带有gsub
的正则表达式:
"[\\x00-\\x7F]+"
该表达式与任何非ASCII字符匹配,并且gsub将其删除(replacement=""
)
示例:
gsub(pattern = "[\\x00-\\x7F]+", replacement = "", "complications: noneco-morbidity:nil \\x0c\\\\xd6\\p__")
[1] "complications noneco-morbiditynil cdp__"
答案 1 :(得分:0)
以下不是一个干净的解决方案。但仍然可能有用。
gsub("x0c|xd6|\\p|\\\\","", mystring)