我试图摆脱数据框列中的某些特定字词。所以数据集看起来有点像3235行:
V1 V2
AUTAUGA COUNTY 1
BALDWIN COUNTY 3
VALDEZ-CORDOVA CENSUS AREA 261
我要做的是:
data$V1 <- replace(data$V1, " COUNTY", "")
但我收到的错误如下:
Error in `$<-.data.frame`(`*tmp*`, "V1", value = c("AUTAUGA COUNTY", :
replacement has 3236 rows, data has 3235
我是否以错误的方式使用该功能?或者还有其他方法吗? 谢谢!
答案 0 :(得分:2)
雨果, 对于您提供的示例,此代码运行良好:
eg <- data.frame(V1 = c("AUTUAGA COUNTY", "BALDWIN COUNTY",
"VALDEZ-CORDOVA CENSUS AREA"),
V2 = c(1, 3, 261))
eg$gsub <- gsub(" COUNTY", "", eg$V1)
eg
- V1 V2 gsub
- 1 AUTUAGA COUNTY 1 AUTUAGA
- 2 BALDWIN COUNTY 3 BALDWIN
- 3 VALDEZ-CORDOVA CENSUS AREA 261 VALDEZ-CORDOVA CENSUS AREA
这是否解决了错误?
(已编辑以修复输出列名称。)