数据集包含一个超过10000个手机号码的列,它还包含一些没有特定格式的垃圾值。 如何仅保留具有正确手机号码的行
细胞编号............评论
9674544444 ............... a
9453453455 ............... c
asd..as23 ..................... d
as sas E2 ................... d
232dsasd .................... ,,,,,,,,,,,,,,, 23 ,,,,, 231
必填表
细胞编号............评论
9674544444 ............... a
9453453455 ............... c
答案 0 :(得分:3)
喜欢这个;
df<-read.table(header=T,sep="|",text="cell number|comment
9674544444|a
9453453455|c
asd..as23|d
as sas E2|d
232dsasd|23,,,,,231")
df[grep("[0-9]{10}",df$cell.number),]
# cell.number comment
#1 9674544444 a
#2 9453453455 c