我目前正在尝试弄清楚如何使用正则表达式来清理R中的文本数据。我想知道在哪里可以找到一个简单的教程吗?我一直在网上看,但是当我在regex101上尝试一些东西时,我几乎找不到匹配。如果我这样做,在R内,没有任何变化。考虑这个例子
Before <- "ACEMOGLU, D., ROBINSON, J., (2012) WHY NATIONS FAIL, (3)"
After <- "ACEMOGLU, D., ROBINSON, J., 2012, WHY NATIONS FAIL, (3)"
> Aftergsub <- gsub("\\([\\d][\\d][\\d][\\d]\\)", "new", "ACEMOGLU, D., ROBINSON, J., (2012) WHY NATIONS FAIL, (3)")
> print(Aftergsub)
[1] "ACEMOGLU, D., ROBINSON, J., (2012) WHY NATIONS FAIL, (3)"
>
当然,“新”应该是一个表达,使之前看起来像After。但根据我的模式,我甚至没有改变之前的任何其他内容。
换句话说,如果前面有4位数,我怎么才将“)”改为“,”? 谢谢!