在我删除了一些文字后,“Ã,”将在文本中的某些单词和数字后添加。为了删除不需要的“Ã,”,我做了几个gsubs。
text <- gsub("Ã", " ", text)
text <- gsub("Â", " ", text)
text <- gsub(",", "", text)
text <- gsub(" ", " ", text)
这适用于删除特殊字符A,但不删除逗号。
gsubs之前的文字是什么样的。
ALBANY OFF REBOUND BY #43 STIRE #43 STIRE is not commented out
gsubs后的文字是什么样的。
ALBANY ‚ OFF ‚ REBOUND BY #43 ‚ STIRE #43 ‚ STIRE is not commented out
我希望文本看起来像什么:
ALBANY OFF REBOUND BY #43 STIRE #43 STIRE is not commented out
任何帮助将不胜感激。如果需要任何进一步的信息,请告诉我。
答案 0 :(得分:2)
您可以使用library(stringr)
text <- "ALBANYÃ, OFFÃ, REBOUND BY"
library(stringr)
str_replace_all(text, "Ã,Â", "")
#> [1] "ALBANY OFF REBOUND BY"
或gsub
:
gsub("Ã,Â","",text)
#> [1] "ALBANY OFF REBOUND BY"
但是,我认为这首先是一个编码问题。
此外,gsub
或str_replace_all
的结果可能与编码不同,这可能是您text <- gsub(",", "", text)
无效的原因。
您可以使用Encoding
检查编码。