删除R中数据中不必要的符号

时间:2018-03-18 13:39:02

标签: r dataframe gsub

这是我的数据集

1.abc
2.def
3.2354
4.. $.?,

如何删除那些只有数字的数字,其中只有符号,如点,逗号......,等等,其中任何符号和数字(1#5 ??%)。和文字中的单词少比两个字母

1 个答案:

答案 0 :(得分:2)

我们可以使用str_count来计算字符数和数据集的子集

library(stringr)
library(dplyr)
df1 %>%
    filter(str_count(v1, "[[:alpha:]]") > 2)

gsub删除任何不是字母的字符,并使用nchar计算字符数以创建用于子集化的逻辑索引

subset(df1, nchar(gsub("[^[:alpha:]]+", "", v1))>2)
#    v1
#1 1.abc
#2 2.def

数据

df1 <- structure(list(v1 = c("1.abc", "2.def", "3.2354", "4.. $.?,")), 
.Names = "v1", class = "data.frame", row.names = c(NA, -4L))