我怀疑有一种方法可以简化此文本的预处理。但是,我找不到如何将所有这些字符替换合并到一行中的解决方案。因此,为避免在当前解决方案中出现所有重复(请参见下文):
Object execute(Object... iArgs) Deprecated.
有人知道我可以如何简化这一过程吗?
谢谢!
答案 0 :(得分:1)
# construct regex where each target pattern is a group ()
# enclose groups in [] to target any of those groups
regex <- "[(Ã\\S*)(â\\S*)(ð\\S*)]"
string <- "Ã x â x ð y "
gsub(regex, "", string)
结果:
[1] " x x y "