我有一个50000x36的数据框,它的结构(请参见图片)具有许多不同的1到4位数字代码和一些Urls。
enter image description here
|ID|url| # | ###[A-Z] | # | ###[A-Z] | NA | ### | ...
我需要用###[A-Z]
查找所有4位代码
([A-Z]是任意一个字母; #
是任何数字),我需要遍历DF,将所有###[A-Z] -> [A-Z]
转换为
df[] = lapply(df, gsub, pattern="^\\d{3}[A-Z]",replacement = "")
这将删除所有选定的条目,但至少找到出现的条目。有人有建议吗?