如何从R中的文本中删除“Ã,”?

时间:2016-03-02 05:49:40

标签: r special-characters gsub

在我删除了一些文字后,“Ã,”将在文本中的某些单词和数字后添加。为了删除不需要的“Ã,”,我做了几个gsubs。

text <- gsub("Ã", " ", text)
text <- gsub("Â", " ", text)
text <- gsub(",", "", text)
text <- gsub("  ", " ", text)

这适用于删除特殊字符A,但不删除逗号。

gsubs之前的文字是什么样的。

 ALBANY OFF REBOUND BY  #43 STIRE       #43 STIRE is not commented out

gsubs后的文字是什么样的。

 ALBANY ‚  OFF ‚  REBOUND BY #43 ‚  STIRE        #43 ‚  STIRE is not commented out

我希望文本看起来像什么:

 ALBANY OFF REBOUND BY #43 STIRE                 #43 STIRE is not commented out

任何帮助将不胜感激。如果需要任何进一步的信息,请告诉我。

1 个答案:

答案 0 :(得分:2)

您可以使用library(stringr)

text <- "ALBANYÃ, OFFÃ, REBOUND BY"

library(stringr)
str_replace_all(text, "Ã,Â", "")
#> [1] "ALBANY OFF REBOUND BY"

gsub

gsub("Ã,Â","",text)
#> [1] "ALBANY OFF REBOUND BY"

但是,我认为这首先是一个编码问题。 此外,gsubstr_replace_all的结果可能与编码不同,这可能是您text <- gsub(",", "", text)无效的原因。

您可以使用Encoding检查编码。