R-如何简化特殊字符的文本清除?

时间:2018-10-28 13:54:58

标签: r text replace text-mining tm

我怀疑有一种方法可以简化此文本的预处理。但是,我找不到如何将所有这些字符替换合并到一行中的解决方案。因此,为避免在当前解决方案中出现所有重复(请参见下文):

Object  execute(Object... iArgs)  Deprecated. 

有人知道我可以如何简化这一过程吗?

谢谢!

1 个答案:

答案 0 :(得分:1)

# construct regex where each target pattern is a group ()
# enclose groups in [] to target any of those groups

regex <- "[(Ã\\S*)(â\\S*)(ð\\S*)]" 
string <- "Ã  x â x ð y "
gsub(regex, "", string)

结果:

[1] "  x  x  y "