如何从r

时间:2019-06-13 11:37:10

标签: r ascii

也许我不了解ascii的细微差别,但我无法从字符串中删除编码。

输入字符串为:

mystring<-"complications:  noneco-morbidity:nil \\x0c\\\\xd6\\p__"

我想要的输出是:

"complications:  noneco-morbidity:nil __"

我的尝试是:

iconv(x, "latin1", "ASCII", sub = "")

但没有删除任何内容

2 个答案:

答案 0 :(得分:1)

将以下模式用作带有gsub的正则表达式:

"[\\x00-\\x7F]+"

该表达式与任何非ASCII字符匹配,并且gsub将其删除(replacement=""

示例:

gsub(pattern = "[\\x00-\\x7F]+", replacement = "", "complications:  noneco-morbidity:nil \\x0c\\\\xd6\\p__")

[1] "complications  noneco-morbiditynil cdp__"

答案 1 :(得分:0)

以下不是一个干净的解决方案。但仍然可能有用。

gsub("x0c|xd6|\\p|\\\\","", mystring)